Введение в агентов, решающих проблемы

От рефлексии к планированию

В эволюции дизайна агентов мы переходим от рефлексивных агентов, которые сопоставляют восприятия напрямую с действиями на основе простых правил (например, «Если машина впереди тормозит, начать торможение»), к агентам, решающим проблемы. Рефлексивные агенты работают в непосредственном контексте, тогда как агенты, решающие проблемы, являются целеориентированными. Они учитывают будущие последствия своих действий, чтобы найти последовательность, удовлетворяющую конкретной цели.

Рефлексивный агент: $Действие = Функция(Восприятие)$
Агент планирования: $Последовательность\_действий = Поиск(Состояние, Цель)$

Атомарное представление состояния

На этом фундаментальном уровне агенты используют атомарное представление. Это означает, что состояние мира рассматривается как черный ящик — единый узел без внутренней структуры, видимой алгоритму поиска. Агент рассуждает только о:

Состояниях ($S$): Снимках окружающей среды.
Действиях ($A$): Переходах между состояниями.
Тест цели: Булева проверка, принадлежит ли состояние $s \in S_{цели}$.

Цикл решения проблем

Агент, решающий проблемы, следует четкому четырехэтапному циклу для навигации по среде:

Формулирование цели: Принятие решения о том, какую цель преследовать, исходя из текущей ситуации.
Формулирование проблемы: Абстрагирование реального мира в математическую модель (Состояния и Действия).
Поиск: Моделирование последовательностей действий для нахождения оптимального пути.
Исполнение: Выполнение действий, найденных на этапе поиска, без дальнейших размышлений (при условии статической среды).

Python Implementation (agent_types.py)

class ReflexAgent:
defactself, percept):
# Прямое сопоставление: Правило -> Действие
return rules.get(percept, default_action)
class ProblemSolvingAgent:
def__init__self):
self.seq = [] # Буферизованная последовательность действий
defactself, percept):
# Если мы находимся в середине выполнения, продолжаем
ifself.seq:
returnself.seq.pop0
# В противном случае, Планируем (Поиск)
        state = self.update_state(percept)
        goal = self.formulate_goal(state)
        problem = self.formulate_problem(state, goal)
# Поиск возвращает список действий
self.seq = search_algorithm(problem)
returnself.seq.pop0